R

Metodologia Quantitativa I (UPF)

Jordi Mas Elias

https://www.jordimas.cat/

Sumari

  • R Workflow
  • Objectes d’R
  • Funcions d’R
  • Tipus d’arxius

Warm up

Paint the fence, first…

Warm up

…karate later.

R

Passos inicials

  • Crear projecte
  • Situar-se a RStudio
  • Instal·lar paquets
  • Carregar paquets
  • Importar arxius
  • Comprovar Environment

RStudio workflow

  • Instal·lar paquets: Un cop l’any.
install.packages(c("dplyr", "ggplot", "tidyr", 
                   "readr", "readxl", "haven", "foreign"))
  • Carregar paquets: Cada vegada que entrem a RStudio.
library(dplyr)
library(ggplot2)
library(readr)

Objectes d’R

Objectes

  • A. Valors
  • B. Vectors: c(value1, value2, value3, ...)
  • C. Marcs de dades: tibble(vector1, vector2, ...)

Objectes. Regles generals

Regles generals per crear objectes:

  • No començar amb un nombre.
  • No pot contenir: ^, !, $, @, +, -, /, *.
  • Sobrescriu, si guardem amb el mateix nom.
  • Sensible a majúscules.

Objectes. Vectors

Table 1: Classe i tipus de vector
Classe Tipus Exemple
Character Character c("b", "c", "d")
Factor Integer factor(c("b", "c", "d"))
Integer Integer c(10L, 6L, 12L)
Numeric Double c(1.1, 3.5, 10.2)
Data Double as.Date(c("2019/06/04", "2019/11/02", "2020/01/23"))
Logical Logical c(FALSE, TRUE, FALSE)

Objectes. Regles

  • Tots els valors d’un vector han de ser del mateix tipus.
  • Tots els vectors en un marc de dades han de tenir la mateixa longitud.
  • Els valors d’un vector es seleccionen amb [ ].
  • Les files i columnes en un md es seleccionen amb [ , ]

Exercici

CHES Latin America

Codebook available here.

  • Fes una ullada (glimpse()) a ches_la object.
  • Quins països tenim al dataset?
  • Selecciona Colombia i crea un objecte nou que es digui ches_co.
  • Torna a fer una ullada al nou dataset (quantes observacions?).
  • Selecciona variables de partit + lrecon, galtan, crime, regions, ethnic_minorities.
  • Sobreescriu l’objecte ches_co amb la transformació.

Funcions

Funcions (I): Regles generals

Regles generals per utilitzar funcions:

  • Poden tenir varis arguments.
    • function(argument1, argument2 ...)
  • Normalment, el primer argument és un vector o un marc de dades.
  • Utilitza ? o ajuda per saber com utilitzar-la.

Funcions (II): Sense arguments

Normalment, quan fem alguna cosa relacionada amb el directori de treball.

ls()
installed.packages()
search()
getwd()

Funcions (III): Amb un argument

Aplicades normalment a un marc de dades:

glimpse()
dim()
summary()

Aplicades normalment a un vector:

#vector de caràcter
unique()
table()

#vector numèric
mean() 
hist()

Funcions (VI): Amb molts arguments

Exercici: Funcions

sample()
seq()
rep()

Ajuda!

Fer servir R és impossible sense ajuda.

  • Utilitza ? abans d’una funció: e.g. ?sample.
  • Cheet Sheats (see Posit website).
  • Utilitza Stackoverflow.
  • Utilitza ChatGPT.
  • Utilitza Google.

Importar dades

Funcions d’importació

File type Package Functions
csv readr read_csv() o read_csv2()
xls readxl read_xls()
xlsx readxl read_xlsx()
dta foreign read.dta()
dta haven read_dta()
sav haven read_sav()
spss haven read_spss()

Funcions d’importació

  • Paquet readr.
read_csv("data/gapminder.csv")
read_csv2("data/gapminder2.csv")
read_tsv("data/gapminder3.tsv")
read_delim("data/gapminder4.txt", delim = "/")
  • Altres paquets:
tibble(foreign::read.dta("data/gapminder5.dta"))
load("data/gapminder6.Rdata")
tibble(foreign::read.spss("data/gapminder7.sav", to.data.frame = T))
read_xlsx("data/gapminder8.xlsx", sheet = 2)